深度学习对医学成像产生了极大的兴趣,特别是在使用卷积神经网络(CNN)来开发自动诊断工具方面。其非侵入性获取的设施使视网膜底面成像适合这种自动化方法。使用CNN分析底面图像的最新工作依靠访问大量数据进行培训和验证 - 成千上万的图像。但是,数据驻留和数据隐私限制阻碍了这种方法在患者机密性是任务的医疗环境中的适用性。在这里,我们展示了小型数据集上DL的性能的结果,以从眼睛图像中对患者性别进行分类 - 直到最近,底眼前图像中才出现或可量化的特征。我们微调了一个RESNET-152模型,其最后一层已修改以进行二进制分类。在几个实验中,我们使用一个私人(DOV)和一个公共(ODIR)数据源评估在小数据集上下文中的性能。我们的模型使用大约2500张底面图像开发,实现了高达0.72的AUC评分(95%CI:[0.67,0.77])。尽管与文献中的先前工作相比,数据集大小降低了近1000倍,但这仅仅是降低25%的性能。即使从视网膜图像中进行性别分类等艰巨的任务,我们也会发现使用非常小的数据集可以进行分类。此外,我们在DOV和ODIR之间进行了域适应实验。探索数据策展对培训和概括性的影响;并调查模型结合在小型开发数据集中最大化CNN分类器性能。
translated by 谷歌翻译
神经科学方面的巨大努力正在努力绘制许多新物种的连接群,包括果蝇果蝇的接近完成。重要的是要问这些模型是否可以使人工智能受益。在这项工作中,我们提出了两个基本问题:(1)生物连接组可以在机器学习中提供的何处以及何时提供使用,(2)哪些设计原理对于提取连接组的良好表示是必要的。为此,我们将秀丽隐杆线虫线虫的运动电路转化为以不同水平的生物物理现实主义水平的人工神经网络,并评估了这些网络在运动和非运动行为任务上训练这些网络的结果。我们证明,生物物理现实主义不必维持使用生物回路的优势。我们还确定,即使没有保留确切的接线图,建筑统计数据也提供了有价值的先验。最后,我们表明,虽然秀丽隐杆线虫运动电路对运动问题提供了强大的感应偏见,但其结构可能会阻碍与运动无关的任务(例如视觉分类问题)。
translated by 谷歌翻译
本文总结了SMM4H 2022任务10的CLAC提交,该提交涉及西班牙推文中提到的疾病的识别。在对每个令牌进行分类之前,我们使用多语言Roberta大型,UMLS Gazetteer和Distemist Gazetteer等功能对每个令牌编码进行编码。我们获得0.869的严格F1得分,竞争平均值为0.675,标准偏差为0.245,中值为0.761。
translated by 谷歌翻译
只要可以预见的是测试代码的固有特征,可以大大降低测试的高成本。本文提供了一种机器学习模型,以预测测试可以在多大程度上覆盖一个名为Coverabeality的新指标。预测模型由四个回归模型的集合组成。学习样本由特征向量组成,其中特征是为类计算的源代码指标。样品由针对其相应类计算的覆盖率值标记。我们提供了一个数学模型,以评估每个班级自动生成的测试套件的尺寸和覆盖范围的测试效果。我们通过引入一种新方法来根据现有源代码指标来定义子计量数来扩展功能空间的大小。使用功能重要性分析在学习的预测模型上,我们按照对测试效果的影响顺序对源代码指标进行排序。结果,我们发现类别严格的循环复杂性是最有影响力的源代码度量。我们对包含大约23,000个类的大型Java项目的预测模型进行的实验表明,平均绝对误差(MAE)为0.032,平均平方误差(MSE)为0.004,R2得分为0.855。与最先进的覆盖范围预测模型相比,我们的模型分别提高了MAE,MSE和R2得分5.78%,2.84%和20.71%。
translated by 谷歌翻译
软件测试可能是一个漫长且昂贵的过程,尤其是如果无法测试的软件进行测试。重构技术可以通过改善影响可检验性的软件指标来增强可检验性。在构建回归模型学习如何将计算的源代码计算指标与其可检验性相关联的指标时,确定了指标。我们确定了15个软件指标,在解释我们的可检测性预测模型的同时,高度影响可检验性。我们使用42个Java类的实验表明,除了改善其他一些质量属性外,改善这15个指标的重构平均可以提高可测试性15.57%。我们的可测试性预测模型经过训练,可以映射源代码指标,以测试有效性和效率,作为可测试软件的两种重要成分。随着测试套件获得的覆盖范围的增加,测试有效性会提高。另一方面,随着测试套件的大小增加,测试效率会降低。本文提供了一个数学模型,以根据测试套件的大小和覆盖范围来计算类可检验性。我们使用此数学模型来计算可测试性作为我们可检测性预测模型的目标。数学模型要求执行正在测试的类以计算测试覆盖范围,而我们的回归模型在静态上测量了测试性。在测试性方面的测试结果预测应在测试之前,以避免不必要的成本。我们的可测试性预测模型已在23,886个Java类和262个软件指标上进行了培训和测试。学习的模型以R2为0.68,平均平方误差为0.03,可预测可验证性。
translated by 谷歌翻译
在最近的过去,草莓的机器人收获引起了很多兴趣。尽管有很多创新,但它们尚未达到与人类采摘专家相当的水平。末端效应单元在定义这种机器人收割系统的效率方面起着重要作用。即使有关于草莓收集的各种最终效应子的报道,但是在某些情况下,研究人员可以依靠某些参数来开发新的最终效应子。这些参数包括可以在花梗上应用的抓地力极限,以有效地抓握,切割草莓花梗所需的力等。这些估计将对目标的最终效应器的设计周期有所帮助,以握住和切割在收获动作期间,草莓花梗。本文通过实验研究了这些参数的估计和分析。据估计,花梗的握力可以限制为10N。这使最终效应器能够抓住高达50克的草莓,而操纵加速度为50 m/s $^2 $,而不会挤压花梗。关于花梗切割力的研究表明,15 n的力足以在30度方向上使用楔形角度为16.6度的刀片切出草莓花梗。
translated by 谷歌翻译
沟通成为各种分布式机器学习设置中的瓶颈。在这里,我们提出了一个新颖的培训框架,可导致代理之间模型的高效通信。简而言之,我们将网络训练为许多伪随机生成的冷冻模型的线性组合。为了进行通信,源代理仅传输用于生成伪随机网络的“种子”标量以及学习的线性混合系数。我们的方法被称为Pranc,比Deep Models学习了近100美元的参数,并且在几个数据集和架构上仍然表现良好。 Pranc启用1)代理之间模型的有效通信,2)有效的模型存储,3)通过即时生成层的重量来加速推理。我们在CIFAR-10,CIFAR-100,TINYIMAGENET和IMAGENET-100上测试Pranc,并具有各种体系结构,例如Alexnet,Lenet,Resnet18,Resnet20和Resnet56,并显示出在这些基础数据集中的可满足性能的同时大大降低的,并显示出大量的降低。 。该代码可用\ href {https://github.com/ucdvision/pranc} {https://github.com/ucdvision/pranc}
translated by 谷歌翻译
从非平稳的输入数据流进行连续/终身学习是智力的基石。尽管在各种应用中表现出色,但深度神经网络仍容易在学习新信息时忘记他们以前学习的信息。这种现象称为“灾难性遗忘”,深深地植根于稳定性困境。近年来,克服深层神经网络中的灾难性遗忘已成为一个积极的研究领域。特别是,基于梯度投射的方法最近在克服灾难性遗忘时表现出了出色的表现。本文提出了基于稀疏性和异质辍学的两种受生物学启发的机制,这些机制在长期的任务上显着提高了持续学习者的表现。我们提出的方法建立在梯度投影内存(GPM)框架上。我们利用神经网络的每一层中的K-获奖者激活来为每个任务执行层次稀疏激活,以及任务间的异质辍学,鼓励网络在不同任务之间使用非重叠的激活模式。此外,我们引入了两个新的基准,用于在分配转移下连续学习,即连续的瑞士卷和Imagenet Superdog-40。最后,我们对我们提出的方法进行了深入的分析,并证明了各种基准持续学习问题的显着性能。
translated by 谷歌翻译
TorchXrayVision是一个开源软件库,用于使用胸部X射线数据集和深度学习模型。它为广泛的公共可公共胸部X射线数据集提供了一个通用的接口和通用预处理链。此外,通过库培训具有不同架构的许多分类和表示模型,通过库可获得不同的数据组合,以用作基线或特征提取器。
translated by 谷歌翻译